Lista taxonómica de referencia de mamíferos (Mammalia) de Costa Rica
Introducción
La Lista taxonómica de referencia de mamíferos (Mammalia) de Costa Rica de BIODATACR permite integrar datos de diferentes publicadores en el sistema e implementar controles de calidad en la ortografía de los nombres científicos, su sinonimia, sus autores y su clasificación, entre otros aspectos.
En este documento, se describe el proceso de elaboración de la lista y se presentan algunas visualizaciones de los datos que contiene.
Elaboración de la lista
El proceso inició con una lista proporcionada por un grupo de expertos en mamíferos de Costa Rica, cuya estructura y formato se refinaron progresivamente para que los nombres científicos pudieran ser verificados en la Infraestructura Mundial de Información en Biodiversidad (GBIF), una organización dedicada a la integración de datos de biológicos de todo el mundo y, específicamente, en su lista taxonómica de referencia o Backbone Taxonomy. Esta lista de GBIF se construye a partir del Catálogo de la Vida (COL) y se completa con cerca de 100 fuentes adicionales de datos. Es actualizada periódicamente por medio de un proceso automático.
La verificación de los nombres científicos de mamíferos de Costa Rica en la lista de GBIF se llevó a cabo mediante un programa en el lenguaje R y su paquete rgbif, el cual proporciona acceso a los servicios web que componen la interfaz de programación de aplicaciones (API) de GBIF. Como resultado de esta verificación, se detectaron errores ortográficos, sinónimos, y se obtuvieron elementos adicionales de datos, como autores y niveles taxonómicos superiores, entre otros.
Seguidamente, se describen en detalle las etapas del proceso de elaboración de la lista taxonómica de referencia de mamíferos de Costa Rica.
1. Lista inicial
La lista inicial contiene 257 especies de mamíferos de Costa Rica y fue recopilada en el contexto del proyecto Biodiversidad en cifras (Tania Bermúdez Rojas & Vilma Obando Acuña, 2021). El documento fue facilitado en formato XLSX (Microsoft Excel) y sus columnas incluyen elementos de datos como niveles taxonómicos (incluyendo ESPECIE, compuesta por el género, el epíteto específico y el autor), referencias bibliográficas y una indicación de si la especie es “esperada” (i.e. no ha sido observada, pero se cree que podría estar presente en el país). Además de los registros de datos, el documento en Excel incluye varias filas con información general y metadatos (ej. título, autor, fecha, etc.).
2. Lista intermedia
Se removieron de la lista inicial aquellas filas que no corresponden a datos (ej. título, autor, fecha, etc.) y el resultado se guardó en formato CSV, como una lista intermedia. De esta manera, se obtuvo un conjunto de datos debidamente estructurado, con una fila por cada especie y una columna por cada elemento de datos.
Además, en la columna ESPECIE se cambió el nombre científico Spheothos venaticus (incorrecto) por Speothos venaticus (correcto). Este corrección debió realizarse en el siguiente paso, en el que se revisó programáticamente la ortografía de los nombres científicos con base en la Lista de referencia taxonómica de GBIF, pero el algoritmo no logró encontrar el nombre correcto para este caso, por lo que se corrigió manualmente.
3. Lista final
La lista intermedia generada en el paso anterior se utilizó como entrada del programa generar-lista-taxonomica.R, el cual, en resumen, ejecuta las siguientes tareas:
“Limpia” la columna
ESPECIEal remover espacios en blanco innecesarios, caracteres especiales (i.e. no alfanuméricos) y palabras siguientes a la segunda (ej. autores), de manera que se conserven solamente las dos primeras palabras: género y epíteto específico (ej. Puma concolor). El resultado se guarda en una nueva columna llamadaname.Busca los nombres científicos de la columna
nameen la Lista de referencia taxonómica de GBIF y para cada uno se recuperan elementos de datos del DwC como:- Nombre científico (género + epíteto específico + autores).
- Niveles taxonómicos (reino, clase, …, familia, género, especie).
- Estado (aceptado, sinónimo).
- Exactitud de la búsqueda (exacta, difusa).
- Nivel de confianza de la búsqueda (0…99).
La lista final consta de los 257 nombres de especies de la lista original, revisados y corregidos, junto con los restantes elementos de datos recuperados de la Lista de referencia taxonómica de GBIF.
Los elementos de datos (i.e. columnas) de la lista final están definidos de acuerdo con el Darwin Core (DwC), un estándar orientado a facilitar la publicación e integración de datos de biodiversidad, el cual incluye un glosario de términos comúnmente utilizados en listas de especies, registros de colecciones biológicas, observaciones de ciencia ciudadana y eventos de monitoreo, entre otras fuentes (Wieczorek et al., 2012). La lista se empaquetó y distribuyó en formato Darwin Core Archive (DwC-A), un archivo comprimido tipo ZIP que contiene archivos de datos en formato CSV y descriptores en formato XML. El DwC-A es el formato preferido para la publicación de datos en GBIF y otras plataformas de integración.
Visualización de los datos
En esta sección, se presentan algunas visualizaciones de las especies de la lista y de sus registros de presencia. Estos últimos fueron recuperados del portal de datos de GBIF.
Especies
Lista final
La siguiente tabla muestra las 257 especies de la lista final. Con los controles, puede modificar la cantidad de especies desplegadas, ordenar los datos y realizar búsquedas.
Diferencias entre la lista inicial y la lista final
La siguiente tabla muestra las especies en las que hay alguna diferencia entre el nombre proporcionado en la lista inicial y el resultante en la lista final (i.e. el encontrado en la lista de referencia taxonómica de GBIF). Las diferencias se deben principalmente al uso de sinónimos y a errores ortográficos.
A esta tabla debe agregarse el caso ya mencionado de Spheothos venaticus, nombre incorrecto en la lista inicial, el cual se sustituyó manualmente por Speothos venaticus, en la lista intermedia.
Cantidad de especies por orden y familia
Registros de presencia
Para tener un idea de los datos de presencia disponibles para las especies de la lista, se realizó una consulta al Portal de datos de GBIF. Se encontraron 36292 registros en 230 especies.
Cantidad de registros de presencia por especie
Especies en GBIF reportadas en Costa Rica y ausentes en la lista de referencia
Se realizó otra consulta al Portal de datos de GBIF, de todos los registros de presencia de la clase Mammalia (todas las especies, no solo las de la lista de referencia), la cual retornó 43435 registros de 313 especies.
Las siguientes son las especies que retornó la consulta y no están en la lista de referencia.
Mapa de distribución
El siguiente mapa muestra la distribución geográfica de los registros de presencia de las 36292 especies de la lista de referencia. Se incluyó una capa para cada uno de los órdenes taxonómicos, las cuales pueden activarse y desactivarse con el control de capas. Al hacer sobre cada punto, pueden observarse algunos elementos de datos del registro de presencia correspondiente.